AI资讯新闻榜单内容搜索-LLM

ICML 2026｜如何对Multi-Agent系统进行过程评估？重新认识多智能体系统中的Orchestrator

来自南京大学 NLP 实验室的 ICML 2026 论文 Recognize Your Orchestrator: An Entropy Dynamics Perspective for LLM Multi-Agent Systems 指出：在当前主流的 Orchestrator-Executor 多智能体架构中，系统失败往往并不首先来自某个执行器不会干活，

来自主题: AI技术研报

8456 点击 2026-07-06 15:48

Router的作用被低估了？vLLM这个神器，让单次调用背后藏了一支模型协作小队

vLLM 社区推出的 Semantic Router 除了专注上面三个方向，正在更进一步：我们认为：router 不只是选择模型，还可以提升模型能力。用户不用改权重，也不用让每个 Agent 团队都自己搭一套 Graph，而是在一次普通 Model API 调用的内部，组织出一支有边界、有预算、有验证、有回退的 “小队”。

来自主题: AI技术研报

8791 点击 2026-07-05 09:43

陈天奇新书上线：面向ML系统的现代GPU编程

前些天，CMU 助理教授、TVM/XGBoost/MLC-LLM 的创造者陈天奇发布了一本免费在线书籍《Modern GPU Programming For MLSys（面向机器学习系统的现代 GPU 编程）》。

来自主题: AI资讯

8143 点击 2026-06-27 15:49

ICML 2026 | Agentic强化学习训练的信息自锁问题

随着大语言模型逐步从「单轮问答」走向「真实环境中的持续交互」，LLM agents 正在被用于越来越复杂的 agentic applications：deep research、coding、computer use、customer service、medical inquiry、troubleshooting 等等。

来自主题: AI技术研报

6295 点击 2026-06-17 14:05

BudgetMem：给Runtime Agent Memory装上「预算路由器」，让记忆系统学会按需分配运行成本

当 LLM Agent 处理长期对话、多轮交互和复杂文档时，Memory 已经成为不可或缺的核心模块。它帮助智能体保存历史、检索信息、维持个性化上下文，并支撑跨时间的推理能力。

来自主题: AI技术研报

8889 点击 2026-06-15 09:20

Anthropic宣告「递归自我提升」时代到来，LLM如何实现自我进化？全景综述带你一探究竟

近日，Anthropic 发布了一篇引发广泛关注的文章《When AI builds itself》。文中披露了极其惊人的内部数据：截至 2026 年 5 月，Anthropic 超过 80% 的合并代码已由 Claude 编写，工程师的日常代码产出飙升了 8 倍；更令人瞩目的是，AI 智能体已经可以自主提出假设、执行长达数百小时的强化安全实验。

来自主题: AI技术研报

11549 点击 2026-06-12 10:13

刚刚，Anthropic道歉了

压力之下，刚刚，《连线》记者 Max Zeff 爆料称，Anthropic 正在撤销这一政策。该媒体从 Anthropic 获得了一份声明，其中写到：「我们正在调整 Fable 5 针对前沿 LLM 开发的安全限制，使其变得可见。」

来自主题: AI资讯

11615 点击 2026-06-11 15:02

斩获15个顶级零日漏洞：0G Lab联合新国立，北大和北邮团队构建的共识协议debug智能体框架

分布式系统的 “圣杯”—— 共识协议（Consensus Protocols），长久以来都是顶级基础设施工程师的 “Bug 地狱”。由于其状态极其复杂、多节点交织，传统测试和单体 LLM 对硬核的 Deep Bug（深层逻辑漏洞）几乎束手无策。

来自主题: AI技术研报

10203 点击 2026-06-11 14:59

一篇综述看懂 agent context compression：怎么压、压什么、谁来压

LLM Agent 做长任务时，真正让人头疼的往往不是模型不会推理，而是上下文开始失控：前几步还很清楚，后面就忘约束、丢状态、重复试错，最后把任务跑成事故现场。

来自主题: AI技术研报

8942 点击 2026-06-11 14:32

万人内测，科研神器Mira爆火！4h肝出论文初稿，全自动接管科研

还在手动在不同工具间来回切换查文献、跑代码、看结果？两个月前发起内侧的科研龙虾SciClaw，经过上万名科研人的「考核」，正式升级为Mira，推出专家小队、科研画布、LLM WIKI 三大核心能力，首次将「Vibe Researching」理念产品化，让研究者像组建实验室团队一样配置 AI，把时间还给真正的科学思考。

来自主题: AI资讯

10944 点击 2026-06-10 11:48